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Linux 的 最 大 的 好 处 之 一 束 古 它 的 源码 公开 。 同时 , 公开 的 核心 源码 也 吸引 看 无 数 的 电脑 爱 





好 者 和 程序 员 ; 他 们 把 解读 和 分 析 Linux 的 核心 源码 作为 目 己 的 最 大 兴趣 ， 把 修改 Linux 
源码 和 改造 Linux 系统 作为 目 己 对 计算 机 技术 退 求 的 最 大 目标 。 

















Linux 内 核 源 码 是 很 具 吸 引力 的 ， 特 别 是 当 你 型 全 了 一 个 分 析 了 好 入 都 没 摘 全 的 问题 ; 





或 者 是 被 你 修改 过 了 的 内 核 ， 顺利 通过 编译 ,一切 运 行 正 芝 的 时 候 。 那 种 成 束 感 真是 油 然而 
生 ! 而 且 ， 对 内 核 的 分 析 ， 除了 出 目 对 技术 的 狂热 奶 求 之 外 ， 这 种 令 人 生长 的 大 动 所 市 来 的 














器 报 也 是 非常 令 人 看 迷 的 ， 这 也 正 古 它 拥 有 众多 退 随 者 的 主要 原因 : 





首先 ， 你 可 以 从 中 学 到 很 多 的 计算 机 的 底层 知识 ， 如 后 面 将 讲 到 的 系统 的 引导 和 人 硬 
件 提 供 的 中 断 机 制 等 ， 其 它 ， 象 虚拟 存储 的 实现 机 制 ， 多 任务 机 制 ， 系 统 保护 机 制 
等 等 ， 这 些 都 是 非 读 源码 不 能 体会 的 。 

同时 ,你 还 将 从 操作 系统 的 整体 结构 中 ,体会 整体 设计 在 软件 设计 中 的 份量 和 作用 ， 
以 及 一 些 宏观 设计 的 方法 和 技巧 : Linux 的 内 核 为 上 层 应 用 提供 一 个 与 具体 硬件 不 
相关 的 平台 ; 同时 在 内 核 内 部 ， 它 又 把 代码 分 为 与 体系 结构 和 人 硬件 相关 的 部 分 ， 和 
可 移植 的 部 分 ; FIG, Linux 虽然 不 是 微 内 核 的 ， 但 他 把 大 部 分 的 设备 驱动 处 理 
成 相对 独立 的 内 核 模块 ， 这 样 减 小 了 内 核 运行 的 开销 ， 增 强 了 内 核 代 码 的 模块 独立 
PE. 
而 且 你 还 能 从 对 内 核 源 码 的 分 析 中 ， 体 会 到 它 在 解决 某 个 具体 细节 问题 时 ， 方 法 的 
巧妙 : 如 后 面 将 分 析 到 了 的 Linux 通过 Botoom_half 机 制 来 加 快 系统 对 中 断 的 处 
] 

最 重要 的 是 : 在 源码 的 分 析 过 程 中 ， 你 将 会 被 一 点 一 点 地 、 洪 移 默 化 地 专业 化 。 一 
个 专业 的 程序 员 ， 总 是 把 代码 的 清晰 性 ， 兼 容 性 ， 可 移植 性 放 在 很 重要 的 位 置 。 他 
们 总 是 通过 定义 大 量 的 宏 ， 来 增强 代码 的 清晰 度 和 可 读 性 ， 而 又 不 增加 编译 后 的 代 



































人 码 长 度 和 代码 的 运行 效率 ， 他 们 总 是 在 编码 的 同时 ， 就 考 夸 到 了 以 后 的 代码 维护 和 


升级 。 项 至 ， 只 要 分 析 百 分 之 一 的 代码 后 ， 你 融会 深刻 地 体会 到 ， 什 么 样 的 代码 才 
是 一 个 专业 的 程序 员 写 的 ， 什 么 样 的 代码 是 一 个 业余 爱好 者 写 的 。 而 这 一 点 是 任何 
没有 真正 分 析 过 标准 代码 的 人 都 无 法 体会 到 的 。 








然而 ， 由 于 内 核 代码 的 元 长， 和 内 核 体系 结构 的 庞杂 ， 所 以 分 析 内 核 也 是 一 个 很 艰难 ， 


很 需要 角力 的 事 : 在 缺乏 指导 和 区 流 的 情况 下 ， 尤 其 如 此 。 只 有 方法 正确 ， 才 能 事 半 功 僧 。 


IF 





于 这 种 考虑 ， 作 者 希望 通过 此 文 能 给 大 家 一 些 借鉴 和 局 迪 。 








由 于 本 人 所 进行 的 分 析 都 是 基于 2.2.5 版 本 的 内 核 ， 所 以 ， 如 果 没 有 特别 说 明 ， 以 下 











分 析 祁 是 基于 i386 FA 2.2.5 版 本 的 Linux 内 核 。 所 有 源 文 件 均 是 相对 于 目录 


/usr/src/linux 的 。 


方法 之 一 : 从 何 入 手 


要 分 析 Linux WI, Ti CD EST BREF EE, TEBE Se TS CEA ZA 
JÉX. BAT AAI eM a, UOTE: 但 对 于 很 多 初级 的 Linux 爱好 者 ， 和 
那些 对 源码 分 析 很 有 兴趣 但 接触 不 多 的 人 来 说 ， 这 还 是 很 有 必要 的 。 











1. Linux 核心 源 程序 通常 都 安装 在 /usr/src/linux 下 ， 而 且 它 有 一 个 非常 简单 的 编号 
约定 : 任何 偶数 的 核心 〈 的 二 个 数 为 借 数 ， 例 如 2.0.30) 都 是 一 个 稳定 地 发 行 的 核心 ， 而 
任何 奇数 的 核心 (例如 2.1.42) 都 是 一 个 开发 中 的 核心 。 





2、 核 心 源 程 序 的 文件 按 树 形 结构 进行 组 织 ， 在 源 程 序 树 的 最 上 层 ， 即 目录 
/usr/src/linux 下 有 这 样 一 些 目录 和 文件 : 





€ COPYING: GPL 有 版权 申 明 。 对 具有 GPL 版 权 的 源 代 码 改 动 而 形成 的 程序 ， 或 使 用 GPL 
工具 产生 的 程序 ， 具 有 使 用 GPL 发 表 的 义务 ， 如 公开 源 代码 ; 











€ CREDITS: 光 采 榜 。 对 Linux 做 出 过 很 大 贡献 的 一 些 人 的 信息 ; 











€ MAINTAINERS: 维护 人 员 列 表 ， 对 当前 版 本 的 内 核 各 部 分 都 有 谁 负责 ; 


€ Makefile: 第 一 个 Makefile 文件 。 用 来 组 织 内 核 的 各 模块 ， 记 录 了 个 模块 间 的 相互 这 
间 的 联系 和 依托 关系 ， 编 详 时 使 用 ;仔细 阅读 备 子 目录 下 的 Makefile 文件 对 弄 清 各 个 文件 
这 间 的 联系 和 依托 关系 很 有 帮助 ; 











@ ReadMe: 核心 及 其 编译 配置 方法 简单 介绍 ; 

€ Rules.make: 各 种 Makefilemake 所 使 用 的 一 些 共同 规则 ; 

9 REPORTING-BUGS: 有 关 报 告 Bug 的 一 些 内 容 ; 

e Arch/ : arch 子 日 录 包 括 了 所有 和 体系 结构 相关 的 核心 代码 。 它 的 每 一 个 子 目 录 部 代表 


一 种 支持 的 体系 结构 ， 例 如 i386 就 是 关于 intel cpu 及 与 之 相 兼 容 体系 结构 的 子 目 录 。PC 
机 一 般 都 基于 此 目录 ; 








e Include/: include 子 目 录 包 括 编译 核心 所 需要 的 大 部 分 头 文 件 。 与 平台 无 关 的 头 文件 在 
include/linux 子 目 录 下 ， 与 intel cpu 相关 的 头 文件 在 include/asm-i386 子 目 录 下 ,而 
include/scsi 目录 则 是 有 关 scsi 设备 的 头 文件 目录 























e Init/: 这 个 目录 包含 核心 的 初始 化 代码 ( 注 :不 是 系统 的 引导 代码 ), 包 含 两 个 文件 main.c 
和 Version.c， 这 是 研究 核心 如 何 工 作 的 好 的 起 点 之 一 。 


e Mm/: 这 个 目录 包括 所 有 独立 于 cpu 体系 结构 的 内 存 管理 代码 ， 如 页 式 存 储 管理 内 存 的 
分 配 和 释放 等 ， 而 和 体系 结构 相关 的 内 存 管 理 代 码 则 位 于 arch/*/mm/, fl] a 
arch/i386/mm/Fault.c: 


e Kernel/: 主要 的 核心 代码 ， 此 目录 下 的 文件 实现 了 大 多 数 linux AAA APA, HR 
最 重要 的 文件 当 属 sched.c; 同样 ， 和 体系 结构 相关 的 代码 在 arch/*/kernel +; 





e Drivers/: 放置 系统 所 有 的 设备 号 动 程 订 ; 每 种 驱动 程序 义 各 占用 一 个 子 日 录 : 如,/block 
下 为 块 设备 驱动 程序 ， 比 如 ide (ide.c)。 如 果 你 希望 查看 所 有 可 能 包含 文件 系统 的 设备 是 
如 何 初始 化 的 ， 你 可 以 看 drivers/block/genhd.c 中 的 device_setup()。 它 不 仪 初始 化 
硬盘， 也 初始 化 网 络 ， 因 为 安装 nfs 文件 系统 的 时 候 需 要 网 络 ; 





e Documentation/: 文档 目录 ,没有 内 核 代码 ， 只 是 一 套 有 用 的 文档 ， 可 惜 都 是 English 
的 ， 看 看 应 该 有 用 的 哦 ; 


。Fs/:_ 所 有 的 文件 系统 代码 和 各 种 类 型 的 文件 操作 代码 ， 它 的 每 一 个 子 目录 支持 一 个 文件 
A, 例如 fat 和 ext2; 


e Ipc/: 这 个 目录 包含 核心 的 进程 间 通 讯 的 代码 ; 


e Lib/: 放置 核心 的 库 代码 ; 


e Net/: 核心 与 网 络 相关 的 代码 ; 





e Modules/: 模块 文件 目录 ， 是 个 空 目录 ， 用 于 存放 编 详 时 产生 的 模块 目标 文件 ; 


e Scripts/: 描述 文件 ， 脚 本 ， 用 于 对 核心 的 配置 ; 





一 般 ， 在 每 个 子 目 录 下 ， 都 有 一 个 Makefile 和 一 个 Readme xit, 和 仔细 阅读 这 两 个 
文件 ， 对 内 核 源码 的 理解 很 有 用 。 





对 Linux 内 核 源码 的 分 析 ， 有 几 个 很 好 的 入 口 点 : 一 个 束 是 系统 的 引导 和 初始 化 ， 即 


从 机 器 加 电 到 系统 核心 的 运行 ; 另外 一 个 就 是 系统 调用 ,系统 调用 是 用 户 程序 或 操作 调用 核 
心 所 提供 的 功能 的 接口 。 对 于 那些 对 便 件 比 较 熟 悉 的 爱好 者 ， 从 系统 的 引导 入 手 进 行 分 析 ， 
可 能 来 的 容易 一 些 ;， 而 从 系统 调用 下 口 ， 则 可 能 更 合适 于 那些 在 dos 或 Uinx、Linux 下 有 
bP C 编程 经 验 的 高 手 。 这 两 点 ， 在 后 面 还 将 介绍 到 。 

方法 之 二 : 以 程序 流程 为 线索 ， 一 线 串 珠 














从 表面 上 看 ，Linux 的 源码 就 象 一 团 扎 乱 无 草 的 乱 肪 ， 其 实 它 是 一 个 组 织 得 有 条 有 理 的 
蛛网 。 要 把 整个 结构 分 析 清 楚 ， 除了 找 出 线头 ,还 得 理 顺 各 个 部 分 之 间 的 关系， 有条不紊 的 
— FA FAL PAT o 





MIR DEP URE A RR RRR, LET AGE REY IT te, TORE AAT ph i Tw 
及 到 的 代码 分 析 清 楚 。 这 种 方法 最 典型 的 应 用 有 两 个 : 一 是 系 统 的 初始 化 过 程 ; 二 是 应 用 程 
序 的 执行 流程 : 从 程序 的 装载 ， 到 运行 ， 一 二 到 程序 的 退出 。 


为 了 条 便 起 见 ， 莉 从 循序 渐进 的 原理 ， 现 焉 系统 的 初始 化 过 程 来 具体 的 介绍 这 种 方法 。 
系统 的 初始 化 流程 包括 : 系统 引导 ， 实 模式 下 的 和 初始化， 保护 模式 下 的 初始 化 共 三 个 部 分 。 
下 面 将 一 一 介绍 。 





inux 系统 的 常见 引导 方式 有 丙种 : Lilo 引导 和 Loadin |; 同时 linux 内 核 也 目 市 
了 一 个 bootsect-loader。 由 于 它 只 能 实现 linux 的 引导 , 不 像 前 两 个 那样 具有 很 大 的 灵活 
性 (lilo 可 实现 多 重 引 导 、loadin 可 在 dos 下 引导 linux) ,所 以 在 普通 应 用 场合 实际 上 很 
少 使 用 bootsect-loader. “448, bootsect-loader 也 有 具有 它 自己 的 优点 : 短小 没有 多 余 
的 代码 、 附 市 在 内 核 源 码 中 、 是 内 核 源 人 码 的 有 机 组 成 部 分 ， 等 等 。 




















bootsect-loader 在 内 和 源码 中 对 应 的 程序 是 /Arch/i386/boot/bootsect.S . Fifi 
将 主要 是 针对 此 文件 进行 的 分 析 。 


1. J'IRAI: 


<1> /Arch/i386/boot/bootsect.S 


<2> /include/linux/config.h 


<3> /include/asm/boot.h 


<4> /include/linux/autoconf.h 


2. 引导 过 程 分 析 : 





对 于 Intel x86 PC, FAEM, HAMA MURAT ROM BIOS 的 一 系列 系统 测 
wave, Hi RAM, keyboard, ré, HERES. HUTTE bios 的 系统 
测试 之 后 ， 紧 接着 控制 权 会 转移 给 ROM 中 的 局 动 程序 (ROM bootstrap routine); 
这 个 程序 会 将 磁盘 上 的 第 0 轨 第 O bX CH boot sector 或 MBR ， 系 统 的 引导 程 
序 就 放 在 此 处 ) 读 入 内 存 中 ， 并 放 到 自 Ox07C0:0x0000 开始 的 512 个 字 节 处 ; 
然后 处 理 机 将 跳 到 此 处 开始 执行 这 一 引导 程序 ， 也 即 装 入 MBR 中 的 引导 程序 后 ， 
CS:IP = 0x07C0:0x0000 。 加 电 后 处 理 机 运行 在 与 8086 RR KIIN Fo 

















如 果 要 用 bootsect-loader 进行 系统 引导 ， 则 必须 把 bootsect.S 编译 连接 后 对 应 
的 二 进 制 代码 置 于 MBR;” 当 ROM BIOS 把 bootsect.S 编译 连接 后 对 应 的 二 进 

制 代 码 装 入 内 存 后 ， 机 器 的 控制 权 就 完全 转交 给 bootsect; ”也 就 是 说 ，bootsect 
将 是 第 一 个 被 读 入 内 存 中 并 执行 的 程序 。 











Bootsect 接管 机 器 控制 权 后 ， 将 依次 进行 以 下 一 些 动 作 : 


1. 首先 ，bootsect 将 它 "自己 "( 自 位 置 0x07C0:0x0000 开始 的 512 个 字 节 ) 从 
4% ROM BIOS 载 入 的 地 址 0x07C0:0x0000 AHF 0x9000:0000 Ab; 这 一 任务 
由 bootsect.S 的 前 十 条 指令 完成 ， 第 十 一 条 指令 "jmpi go,INITSEG"”“ 则 把 机 器 跳 
转 到 "新 ”的 bootsect 的 "jmpi go,INITSEG”“ 后 的 那 条 指令 “go: mov 
di,#0x4000-12"; 之 后 ， 继 续 执行 bootsect 的 剩 下 的 代码 ; 在 bootsect.S 中 定 
MT JLB: 


BOOTSEG = 0x07C0 bios 4A MBR 的 约定 位 置 的 段 址 ; 





INITSEG = 0x9000 bootsect.S 的 前 十 条 指令 将 自己 搬 到 此 处 ( 段 址 ) 
SETUPSEG =0x9020 装 入 Setup.S 的 段 址 


SYSSEG =0x1000 系统 区 段 址 








对 于 这 些 常量 可 参见 /include/asm/boot.h 中 的 定义 ; 这 些 常量 在 下 面 的 分 析 中 将 
会 经 常用 到 ; 








2. 以 0x9000:0x4000-12 Atel, 建立 自己 的 栈 区 ; 其 中 0x9000:0x4000-12 
到 0x9000:0x4000 的 一 干 二 个 字 节 预 留 作 人 磁盘 参数 表 区 ; 


3. Æ 0x9000:0x4000-12 到 0x9000:0x4000 的 一 十 二 个 预 留 字 节 中 建立 新 的 
做 盘 参 数 表 , 之 所 以 叫 ` 新 "的 磁盘 参数 表 , 是 相对 于 bios 建立 的 磁盘 参数 表 而 言 的 。 
由 于 设计 者 考虑 到 有 些 老 的 bios 不 能 准确 地 识别 磁盘 "每 个 磁道 的 面 区 数 “， 从 而 导 
3X DIOS 建立 的 磁盘 参数 表 妨 但 磁盘 的 最 遍 性 能 发 挥 ， 所 以 ， 设 计 者 驶 在 bios 建立 
的 磁盘 参数 表 的 基础 上 通过 枚 举 法 测试 ， 试 图 建立 准确 的 "新 “的 磁盘 参数 表 ( 这 是 在 
后 继 步 又 中 完成 的 ); 并 把 参数 表 的 位 置 由 原来 的 0x0000:0x0078 搬 到 
0x9000:0x4000-12; 且 修 改 老 的 磁盘 参数 表 区 使 之 指 回 新 的 磁盘 参数 表 ; 























4.  FKMAIT load. setup 子 过 程 ， 它 调用 0x13 PHE 2 SIRS; 把 第 0 
道 第 2 扇 区 开始 的 连续 的 setup. sects (为 常量 4) 个 扇 区 读 到 紧邻 bootsect 的 内 
存 区 ; BY 0x9000:0x0200 开始 的 2048 个 宇 节 ;而 这 四 个 而 区 的 内 容 即 是 
/arch/i386/boot/setup.S 编译 连接 后 对 应 的 二 进 制 代 码 ; 也 就 是 说 ， 如 果 要 用 
bootsect-loader 进行 系统 引导 ， 不 仅 必 须 把 bootsect.S 编译 连接 后 对 应 的 二 进 
制 代 码 置 于 MBR, 而 且 还 得 把 setup.S 编译 连接 后 对 应 的 二 进 制 代码 置 于 紧 跟 MBR 
后 的 连续 的 四 个 扇 区 中 ; 当然 ， 由 于 setup.S 对 应 的 可 执行 码 是 由 bootsect 装载 
的 ， 所 以 ， 在 我 们 的 这 个 项 目 中 可 以 通过 修改 bootsect 来 根据 需要 随意 地 放置 
setup.S 对 应 的 可 执行 码 ; 









































5. load setup 子 过 程 的 唯一 出 口 是 probe loop 子 过 程 ; 该 过 程 通过 枚 举 法 测试 
RENAN RE J DK"; 





6. 接 下 来 儿 个 子 过 程 比较 清晰 易 异 :打印 我 们 熟悉 的 "Loading”; iA RESI 
0x1000:0x0000; fbi: 根据 的 5 步 测 出 的 "每 个 磁道 的 届 区 数 “ 人 确定 人 磁 
盘 类 型 ， 最 后 跳 转 到 0x9000:0x0200, 即 setup.S 对 应 的 可 执行 码 的 入 口 ， 将 机 
FAX EX Setup.S; 整 个 bootsect 代码 运行 完毕 ; 


3， 引 寻 过 程 执 行 完 后 的 内 存 印象 图 : 


FOOO 4000-00 


NEANS 


LOCO: 0000 


AT 


FU: 0010 


UU: 0000 


DEO: 0200 


OCO.4000 


OOO 4000-00 


RETRAT 


区 
A 
T RE ER 


OCO: O5 00 





HHP tay Aer, TENEBIT. RAE POS XNA BT. AA PAAR ABRE, 
只 是 此 引导 过 程 中 的 一 个 很 小 的 部 分 ， 并 不 影响 对 整体 的 把 握 。 完 成 了 系统 的 引导 后 ， 系 统 
将 进入 到 初始 化 处 理 阶 段 。 系 统 的 初始 化 分 为 实 模式 和 保护 模式 两 部 分 。 








11、 实 模式 下 的 初始 化 





实 模式 下 的 初始 化 ,主要 是 指 从 内 核 引 导 成 功 后 ， 到 进入 保护 模式 之 前 系统 所 做 的 一 些 
处 理 。 在 内 核 源 码 中 对 应 的 程序 是 /Arch/i386/boot/setup.S; 以 下 部 分 主要 是 针对 此 文 
件 进 行 的 分 析 。 这 部 分 的 分 析 主 要 是 要 弄 懂 它 的 处 理 流程 科 INITSEG(9000:0000) 段 参数 
表 的 建立 ， 此 参数 表 包 含 了 很 多 硬件 参数 ， 这些 都 是 以 后 进行 保护 模式 下 初始 化 ， 以 及 核心 
建立 的 基础 。 














1. 几 个 其 它 相 关 文 件 : <1> /Arch/i386/boot/bootsect.S 


<2> /include/linux/config.h 


<3> /include/asm/boot.h 


<4> /include/ asm/segment.h 


<5> /include/linux/version.h 


<6> /include/linux/compile.h 


2. 实 模 式 下 的 初始 化 过 程 分 析 : 


Linux St, FBI toil 
"AASS" Er 54537 (EP setup," < 开始 > 


GIX RE. 正确 , 则 setup 区 党 部 


zt 9000; 0200 # 9000; qanm À Shee A 
JS 


间 ; Go), HHA AH 
LE 1000: 000 Z 5. 















BETH 
Fe ae LE 8k BM a "AASS" MI “SASA” 
À 1000, ir 8869 Bab Z 


“tide setup BRE 
MHEN. Etre FHE 2 





1 正确 位 置 
18 setua 余部 搬 和 至 前 部 setup 之 后 ， 即 90004000 


| 小 正确 
Brew eo 
pass 和 “= A 5 a À 






BEA SEED 


Aloe 5 |S fe FE 
ALAR? 









Aico Wrong loader: giving up." 





BE AGERE Ae extended memcry ls FF 
A 9000-0002 


| BA wideo 程 序 .设置 视频 参数 | 


将 hd 和 hdal FES, A z0DDD:|4*Dz41] 
的 32 TERRE] 0x0:9000 0x0080 


up 














| Linux 实 模式 下 的 初始 化 流程 图 二 | 










ETE TE 
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将 fdal FE CA Ox6000:0x0060 起 
的 15 TP) TEE 


fe MCA bus, SESA BT 0:9000:0x004 0 


fees PS tre CU Ox6000: Oxf 23 
Dzaa GiB E 0 


OES APM BIOS, ESA ËI T Uzuuuu:Uzuu64 
| 0001: 0z0082 ËJ =+ — == 


关中 断 , 并 禁止 NI 请求 
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ee ae KFRNFI 2 — 
CP 一 一 不 


im 


lA SY SEEG 5 INITZEC [RIEF] AK B TE ASE Pee, 


Ege 4K 49 RCE) 00100:0000 4F 





REH ate J SETUPSEG ah, 
ATE MELA 


B id ATIS gd RLE x ?xxxx, JE 256 TAD H f — T ta 0 — T ES 








使 4210 A: 


FT RÉ AAS 82594-1.99594-9 Bate 


EA TEI A 


intel 把 0-11 Et 
BARES REY, i 
TEM M| HE a h 54 ut E 
[x08—DsDF Pr CL a € 
Mint. HP DT ut S 
[x 1[-—[»2F 


INITSEG(9000:0000) SK: (参见 1nclude/ linux/ tty.h) 


偏 移 量 ( 段 址 均 为 0X9000) 


长 度 Byte 


PARAM_CURSOR_POS 
0x0000 

2 
Arch/i386/boot/video.S 
extended mem Size 
0x0002 

2 
Arch/i386/boot/setup.S 


0x0004 

2 
Arch/i386/boot/video.S 
PARAM_VIDEO_MODE 
0x0006 

1 
Arch/i386/boot/video.S 
PARAM VIDEO COLS 
0x0007 

1 
Arch/i386/boot/video.S 
没 用 

0x0008 

2 

Include/linux/tty.h 


PARAM VIDEO EGA BX 


0x000a 

2 
Arch/i386/boot/video.S 
没 用 

0x000c 

2 


参考 文件 


PARAM_VIDEO_PAGE 


Include/linux/tty.h 
PARAM_ VIDEO LINES 
Ox000e 

1 
Arch/i386/boot/video.S 
PARAM_HAVE_VGA 
0x000f 

1 
Arch/i386/boot/video.S 
PARAM_FONT_POINTS 
0x0010 

2 
Arch/i386/boot/video.S 
PARAM_LFB_WIDTH 
0x0012 

2 
Arch/i386/boot/video.S 
PARAM LFB HEIGHT 
0x0014 

2 
Arch/i386/boot/video.S 
PARAM LFB DEPTH 
0x0016 

2 
Arch/i386/boot/video.S 
PARAM LFB BASE 
0x0018 

4 
Arch/i386/boot/video.S 
PARAM LFB SIZE 
Ox001c 

A 
Arch/i386/boot/video.S 
AAA® 

0x0020 

4 


Include/linux/tty.h 
PARAM_LFB_LINELENGTH 
0x0024 

2 
Arch/i386/boot/video.S 
PARAM_LFB_COLORS 
0x0026 

6 
Arch/i386/boot/video.S 
ARH 

0x002c 

2 
Arch/i386/boot/video.S 
PARAM_VESAPM_SEG 
0x002e 

2 
Arch/i386/boot/video.S 
PARAM_VESAPM_OFF 
0x0030 

2 
Arch/i386/boot/video.S 
PARAM_LFB_PAGES 
0x0032 

2 
Arch/i386/boot/video.S 
Ti EH 

0x0034--0x003f 


Include/linux/tty.h 

APM BIOS Version®) 
0x0040 

2 
Arch/i386/boot/setup.S 
BIOS code segment 
0x0042 

2 


Arch/i386/boot/setup.S 
BIOS entry offset 
0x0044 

4 
Arch/i386/boot/setup.S 
BIOS 16 bit code seg 
0x0048 

2 
Arch/i386/boot/setup.S 
BIOS data segment 
0x004a 

2 
Arch/i386/boot/setup.S 
LFF 32 bs 

0x004c 

2 
Arch/i386/boot/setup.S 
BIOS code seg length 
0x004e 

4 
Arch/i386/boot/setup.S 
BIOS data seg length 
0x0052 

2 
Arch/i386/boot/setup.S 
hd0 参数 

0x0080 

16 
Arch/i386/boot/setup.S 
hd0 参数 

0x0090 

16 
Arch/i386/boot/setup.S 
PS/2 device fi 
OxO1ff 

1 


Arch/i386/boot/setup.S 


* YE: (D Include/linux/tty.h : CL MAGIC and CL OFFSET here 


1. Include/linux/tty.h : 


unsigned char rsvd size; /* Ox2c */ unsigned char rsvd pos; /* Ox2d */ 


© 0 表示 没有 APM BIOS 





© 0x0002 置 位 表示 文 持 32 位 模式 





© 0 表示 没有 ，0x0aa 表示 有 鼠标 器 
111、 保 护 模式 下 的 初始 化 


保护 模式 下 的 初始 化 , 是 指 处 理 机 进入 保护 模式 后 到 运行 系统 第 一 个 内 核 程 序 过 程 中 系 
统 所 做 的 一 些 处 理 。 保 护 模 式 下 的 初始 化 在 内 核 源 码 中 对 应 的 程序 是 
/Arch/i386/boot/compressed/head.S 和 /Arch/i386/KERNEL/head.S ; 以 下 部 分 
主要 是 针对 这 两 个 文件 进行 的 分 析 。 





1. JL HASC: 


«1.» /Arch/i386/boot/compressed/head.S 


«2.» /Arch/i386/KERNEL/head.S 


«3.» //Arch/i386/boot/compressed/MISC.c 


«4.» /Arch/i386/boot/setup.S 


«5,» /include/ asm/segment.h 


«6.» /arch/i386/kernel/traps.c 


«7.» /include/i386/desc.h 


«8.» /include/asm-i386/processor.h 


2. 保护 模式 下 的 初始 化 过 程 分 析 : 


一 、/ Arch/ i386/ KERNEL/ head.S 流程 : 


/hrch/1386/EERNEL /head. S 流程 图 一 
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[CL MAGIC ADDR] 
==CL MAGIC? 
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. /Arch/i386/boot/compressed/head.S 流程 : 


H pushl $0. popi fé Failed 


BSS jË setup. SAORI? | [pcs eae 
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1， 从 流程 图 中 可 以 看 到 ， 保 护 模 式 下 的 初始 化 主要 干 了 这 样 儿 件 事 : 
a. 解压 内 核 到 Ox100000 处 、 
b. 建立 页 目录 和 pg0 页 表 并 局 动 分 页 功能 ( 即 虚 存 管理 功能 )、 
c. 保存 实 模式 下 测 到 的 硬件 信息 到 empty_zero_page、 初 始 化 命令 缓存 
区 、 
d. # cpu 类 型 、 检 查 协 处 理 器 、 
e. EEZ gdt 全 局 描述 符 表 、 和 中 断 描述 附 表 idt; 











2. 从 页 目录 和 pg0 页 表 可 以 看 出 ，0&#0:; 4M 物理 内 存 被 用 作 系统 区 ， 它 被 映射 到 
系统 段 线性 宇 间 的 0&#0; 4M 和 3G&#0; 3G+4M; 即 系 统 可 以 通过 访问 这 两 个 
段 来 访问 实际 的 O80; AM 物理 内 存 ， 也 就 是 系统 所 在 的 区 域 ; 

3.， 本 来 在 实 模式 下 初始 化 时 已 经 建立 了 全 局 描述 符 表 gdt, 而 此 处 重新 建立 全 局 描述 
FR gdt 则 主要 是 出 于 两 个 原因 : 一 个 就 是 天 内 核 是 大 内 核 bzimag， 则 以 前 建立 
的 gdt， 可 能 已 经 在 解压 时 被 宪 雷 挥 了 所 以 ， 在 这 个 源 公文 件 中 均 只 采用 相对 转移 
指令 jxx nf 或 jxXx nb; 二 是 以 前 建立 的 gdt 是 建立 在 实地 址 方式 下 的 ， 而 现在 则 
是 在 局 用 保护 虚拟 地 址 方式 之 后 建立 的 ， 也 即 现 在 的 gdt 是 建立 在 逻辑 地 址 ( 即 线 
性 地 址 ) EHS; 

4. 每 次 建立 新 的 gdt 后 和 启用 保护 虚拟 地 址 方式 后 都 必须 重新 装载 系统 栈 和 重新 初始 
化 各 段 寄 存 器 :cs,ds,es,fs,gS; 

5. 从 实 模 式 下 的 初始 化 和 保护 模式 下 的 初始 化 过 程 可 以 看 出 ，linux 系统 由 实 模式 进 
入 到 保护 模式 的 过 程 大 致 如 下 : 
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6 由 于 分 页 机 制 只 能 在 保护 模式 下 启动 ， 不 能 在 实 模式 下 启动 ， 所 以 第 一 步 是 必要 的 ; 又 
因为 在 386 保护 模式 下 gdt 和 idt 是 建立 在 逻辑 地 址 (线性 地 址 ) 上 的 ， 所 以 第 三 步 也 是 必 
要 的 ; 


7. 经 过 实 模式 和 保护 模式 下 的 初始 后 ， 主 要 系统 数据 分 布 如 下 : 








初始 后 主要 系统 数据 分 布 表 
位 置 
系统 数据 


大 小 

0x101000 

页 目录 swapper. pg. dir 
4K 

0x102000 

页 表 pgO 

4K 

0x103000 
empty bad page 

4K 

0x104000 
empty bad page table 
4K 

0x105000 

empty zero page 

4K 

0x105000 
系统 便 件 参数 

2K 

0x105800 

命令 绥 冲 区 

2K 

0x106000 

全 局 摘 述 附 表 gdt table 
4192B 


从 上 面 对 Linux 系统 的 初始 化 过 程 的 分 析 可 以 看 出 ， 以 程序 执行 流程 为 线索 、 一 线 串 
珠 ， 风 是 按照 程序 的 执行 先后 顺序 ， 卉 慌 程 序 执行 的 各 个 阶段 所 进行 的 处 理 ， 及 其 各 阶段 之 
间 的 相互 联系 。 而 流程 图 应 该 是 这 种 分 析 方 法 最 合适 的 表达 工具 。 





事实 上 ， 以 程序 执行 流程 为 线 标 ,是 分 析 任 何 源 代 码 都 首选 的 方法 。 由 于 操作 系统 的 特 
殊 性 , 光 用 这 种 方法 是 远 远 不 够 的 。 当 然 用 这 种 方法 来 分 析 系 统 的 初始 化 过 程 或 用 户 进 程 的 
执行 流程 应 该 说 是 很 有 效 的 。 

















